學習撰寫程式時,常會遇到資料結構(Data Structure)這個詞彙,指的是如何用最有利的型態儲存或組織資料,並將其存在記憶體當中,以便電腦更有效率的使用。Pandas 本身有兩種常用的資料結構:Series 和 DataFrame!今天,就讓我先分享最基礎的 Series 篇吧!內容包含:
Series 在 Pandas 中適用於處理「單維度」的資料,以「一維陣列」呈現,每個元素都有其對應的索引(編號),就像數學線型函數中提到的「一對一」的概念。其資料內容可以包含數值、字串等多種類型的數據,因此能進行多種操作,如:新增、修改、數值運算和字串運算等。
使用 Series( )
語法,搭配 Python 的列表(list)創建 Series 物件
舉例:創建名為 numbers 和 countries 的 Series 物件
import pandas as pd
numbers = pd.Series([15,25,35,45,55])
countries = pd.Series(['Taiwan','Japan','Korea','USA','Canada'])
print(numbers)
print('--------------------')
print(countries)
輸出結果:
「索引」,可以白話文解讀為「找到特定位置的資料」!創建 Series 時,電腦會自動從 0 開始編號,提供每一個元素一個索引值,如: countries 中,Taiwan 的索引值即為 0 。
import pandas as pd
countries = pd.Series(['Taiwan','Japan','Korea','USA','Canada'])
print(countries[0]) # 取索引值 0 的資料
print('--------------------')
print(countries[1:4]) # 取索引值 1 到 3 的資料
輸出結果:
若想自行定義索引值的話,可以用 index
參數進行設定
舉例:創建名為 coutries 的 Series 物件,並設定索引值為 No1 至 No5
import pandas as pd
countries = pd.Series(['Taiwan','Japan','Korea','USA','Canada'],index=['No1','No2','No3','No4','No5'])
print(countries) # countries 完整資料
print('--------------------')
print(countries['No3']) # 取索引值 No3 的資料
輸出結果:
Series.values
:返回 Series 中的元素Series.size
:返回 Series 中的元素數量Series.index
:返回 Series 的索引Series.dtype
:返回 Series 的數據型態Series.shape
:返回 Series 的數據形狀舉例:創建名為 numbers 的 Series 物件,並觀察其屬性
import pandas as pd
numbers = pd.Series([15,25,35,45,55])
print(numbers.values)
print(numbers.size)
print(numbers.index)
print(numbers.dtype)
print(numbers.shape)
輸出結果:
以上 是今天的 Series 篇的分享,明天會再繼續介紹 DataFrame 篇唷!
如果有任何不理解、錯誤或建議的話,歡迎留言給我!喜歡的話,也歡迎按讚訂閱!
我是 Eva,一位正在努力跨進資料科學領域的女子!我們下一篇文章見!Bye Bye~
【本篇文章將同步更新於個人的 Medium】